Made-to-Measure data kurser
1 Hvad stedet nu hedder for tiden.
2 Roskilde Universitetsbibliotek
KUB Datalab er Københavns Universitetsbiblioteks tilbud til studerende om vejledning og undervisning i arbejde med data. Vi tilbyder kurser i grundlæggende programmering, dataanalyse og -visulisering. Undervisningen sker både “indlejret” hvor vi indgår i et egentligt kursusforløb på universitetet, og som åbne kurser.
Studerende henvender sig regelmæssigt med ønsker om kurser med meget specifikt indhold. Dette behov vil vi gerne imødekomme, men det er for ressourcekrævende at skulle udvikle enkeltstående kurser for måske kun 5 studerende.
Vi har derfor udviklet et meget omfattende generelt kursus, der dækker mange, men dog ikke alle, de eksempler på konkrete ønsker vi har oplevet. Dog foreløbig kun i programmeringssproget R, omend de fleste af teknikkerne er sprog-agnostiske.
Materialet er opbygget i Workbench infrastrukturen fra Carpentries (“The Carpentries” 2025) med brug af sandpaper (Kamvar and Nitta 2024) pakken, og tilgængeliggjort på GitHub.
Det indeholder en samling af “episoder”, ideelt i en længde svarende til ca. 25 minutters undervisning. Episoderne kan ikke være fuldstændigt uafhængige; nogle emner baserer sig på en forståelse af grundlæggende statistiske begreber og kendskab til R, men idealet er at de er så uafhængige af andre som muligt, men så afhængige som nødvendigt.
Kursets didaktiske tilgang er baseret på Teaching Tech Together (Wilson 2019) og Carpentries (“The Carpentries” 2025) filosofien.
Der er fokus på “code-along” hvor de studerende forventes og opfordres til at “taste med”. Målet er ikke at dække mest mulig teori, men at efterlade de studerende med praktiske færdigheder.
Figure 1: Kursussiden
Med udgangspunkt i Github-pages, klones den samlede kursusside til et nyt repositorie på Github. Baseret på de konkrete behov redigeres en enkelt setup-fil, så kun de ønskede episoder indgår. Redigeringen tager under fem minutter, mens det tager GitHub op til en halv time at “bygge” siden.
• Reproducible Data Analysis • Reading data from file • Tidy Data • A deeper dive into pipes • R on Ucloud • Setup for GIS
• Descriptive Statistics • Table One • Nicer barcharts • How is the data distributed? • The normal distribution • Testing for normality
• Central Limit Theorem • Power Calculations
• Linear regression • Multiple Linear Regression • Logistic regression
• k-means • ANOVA
Figure 2: Det kan være svært at overvinde trangen til at tilføje mere. (Horst 2025)
Panum UngdomsForsker Forening, PUFF, er en studenterforening drevet af frivillige medicinstuderende på Københavns Universitet, der arbejder for at forbedre vilkårene for medicinsk studenterforskning.
PUFF har gennem flere år tilbudt et kursus i statistisk metode & det statistiske programmeringssprog R. Kurset blev gennemført over 5 eftermiddage/aftener á 3 timer, og med en professor i biomedicinsk statistik som underviser. Efter COVID-19 pandemien oplevede de vanskeligheder med at tiltrække deltagere til det relativt dyre kursus.
KUB Datalab har siden 2023 overtaget R-delen af kurset, baseret på materiale trukket fra vores toolbox.
Noget om noget med Roskilde og statistik
Ud over at danne grundlag for målsyede kurser, fungerer værktøjskassen også som intern videnbank, hvor vi kan finde noter om hvordan man gør specifikke ting.
Made-to-Measure data kurser